Enable module state_dict compression, simplify compression logic #302

kylesayrs · 2025-04-22T20:20:12Z

Purpose

Enable ModelCompressor.compress to compress individual modules, as is required by Reduce memory requirements
Reduce logic required for mapping modules to schemes
Reduce logic required for skipping zero_point saving

Changes

map_modules_to_quant_args -> map_module_to_scheme
- Narrow the return type from a str, qargs, or tuple of qargs to just the scheme applied to that module
- Reduce logic which parses this unnarrowed return type
SimplifyModelCompressor.compress
- Condense zero_point handling into _skip_zp
- Handle compressing individual modules

Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>

rahul-tuli

Looks good to me! great job!

src/compressed_tensors/compressors/quantized_compressors/base.py

Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>

dsikka

We need to run all our e2e tests before this can land.

src/compressed_tensors/compressors/quantized_compressors/base.py

…heme

kylesayrs · 2025-04-23T18:04:52Z

✅ https://github.com/neuralmagic/llm-compressor-testing/actions/runs/14624966862

dsikka

lgtm, we should wait to merge until after release

…gic (#302)" This reverts commit 4438d08.

…gic (#302)" (#306) This reverts commit 4438d08.

kylesayrs added 2 commits April 22, 2025 16:12

use map_module_to_scheme, _should_save_zp

97bda13

Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>

remove unused import

6060bbe

Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>

kylesayrs changed the title ~~[Cleanup] map_module_to_scheme, _should_save_zp~~ Enable module state_dict compression, simplify compression logic Apr 22, 2025

kylesayrs requested review from dsikka and rahul-tuli April 22, 2025 21:04

kylesayrs added 2 commits April 22, 2025 17:05

remove unused imports

9e82ddb

Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>

rename to _skip_zp

f324af7

Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>

kylesayrs mentioned this pull request Apr 22, 2025

[Performance] Add memory compression and decompression pathways #301

Merged

rahul-tuli previously approved these changes Apr 23, 2025

View reviewed changes

src/compressed_tensors/compressors/quantized_compressors/base.py Outdated Show resolved Hide resolved

type hint nit

83fcffd

Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>

kylesayrs dismissed rahul-tuli’s stale review via 83fcffd April 23, 2025 15:19

safetensors function signature is weird

ddca6a5

Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>

dsikka requested changes Apr 23, 2025

View reviewed changes

brian-dellabetta approved these changes Apr 23, 2025

View reviewed changes

src/compressed_tensors/compressors/quantized_compressors/base.py Show resolved Hide resolved

Merge remote-tracking branch 'origin' into kylesayrs/map_module_to_sc…

ecb3f8c

…heme

kylesayrs requested a review from dsikka April 24, 2025 14:26

dsikka approved these changes Apr 24, 2025

View reviewed changes

kylesayrs enabled auto-merge (squash) April 28, 2025 15:15

kylesayrs merged commit 4438d08 into main Apr 28, 2025
1 check passed

kylesayrs deleted the kylesayrs/map_module_to_scheme branch April 28, 2025 15:16

kylesayrs added a commit that referenced this pull request Apr 28, 2025

Revert "Enable module state_dict compression, simplify compression lo…

2846b6a

…gic (#302)" This reverts commit 4438d08.

kylesayrs mentioned this pull request Apr 28, 2025

Revert "Enable module state_dict compression, simplify compression lo… #306

Merged

dsikka pushed a commit that referenced this pull request Apr 28, 2025

Revert "Enable module state_dict compression, simplify compression lo…

1068c84

…gic (#302)" (#306) This reverts commit 4438d08.

kylesayrs mentioned this pull request Apr 28, 2025

Enable module state_dict compression, simplify compression logic #307

Merged

brian-dellabetta restored the kylesayrs/map_module_to_scheme branch April 28, 2025 18:03

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Enable module state_dict compression, simplify compression logic #302

Enable module state_dict compression, simplify compression logic #302

kylesayrs commented Apr 22, 2025 •

edited

Loading

Uh oh!

rahul-tuli left a comment

Uh oh!

Uh oh!

dsikka left a comment

Uh oh!

Uh oh!

kylesayrs commented Apr 23, 2025 •

edited

Loading

Uh oh!

dsikka left a comment

Uh oh!

Uh oh!

Uh oh!

Enable module state_dict compression, simplify compression logic #302

Enable module state_dict compression, simplify compression logic #302

Conversation

kylesayrs commented Apr 22, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Purpose

Changes

Uh oh!

rahul-tuli left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

dsikka left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

kylesayrs commented Apr 23, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

dsikka left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Uh oh!

kylesayrs commented Apr 22, 2025 •

edited

Loading

kylesayrs commented Apr 23, 2025 •

edited

Loading